ده مقاله فارسی درباره پردازش زبان طبیعی (water mark)

RSS

عضو شوید

:: فراموشی رمز عبور؟

عضویت سریع

به وبلاگ من خوش آمدید

براي اطلاع از آپيدت شدن وبلاگ در خبرنامه وبلاگ عضو شويد تا جديدترين مطالب به ايميل شما ارسال شود

آمار مطالب

:: کل مطالب : 63401
:: کل نظرات : 0

آمار کاربران

:: افراد آنلاین : 1
:: تعداد اعضا : 55

کاربران آنلاین

آمار بازدید

:: بازدید امروز : 10694
:: باردید دیروز : 56567
:: بازدید هفته : 439802
:: بازدید ماه : 477749
:: بازدید سال : 9683130
:: بازدید کلی : 20475794

ده مقاله فارسی درباره پردازش زبان طبیعی (water mark)

نوشته شده توسط : زپو

1-شناسایی و تحلیل واژگان عمومی در منابع وب: رویکردی نو به بسط عبارات جستوجو با استفاده از زبان طبیعی در موتورهای کاوش (همایش انجمن کتابداری و اطلاع رسانی ایران)

چکیده: بازیابی اطلاعات دقیق و مرتبط همواره از اهمیت ویژه ای در پژوهش های حوزه بازیابی اطلاعات برخوردار بوده است. مقاله حاضر رویکردی جدید را در این زمینه معرفی و تجربه کرده است. بسط جستجو با استفاده از واژه های عمومی که همراه کلیدواژه های موضوعی در منابع و متون موجود در وب ظاهر میشوند می تواند موجب افزایش میزان دقت و ربط د رنتایج بازیابی در موتور های کاوش شود. به این منظور پژوهشی در دو مرحله انجام گرفت. در مرحله نخست، تعداد 800 صفحه وب با استفاده از روش تحلیل محتوا مورد بررسی قرار گرفت و واژه های عمومی همراه هر کلید وازه موضوعی شناسایی شد (جمعا 4264 مورد). نتایج تحلیل آماری نشان داد که 14.5 % از واژه های عمومی میان دو حوزه مشترک هستند، یعنی عمومی مطلق به شمار می آیند، 85.5 % واژه های عمومی وابسته به وزه عمومی می باشند. 65 % واژه های عمومی پیش و 35% از آنها پس از کلیدوازه های موضوعی در متون ظاهر می شوند. همچین از نظر نوع واژه ها 62.4 % غیر موضوعی 37.6% نیمه موضوعی به شمار می آید.

کلید واژه ها: بسط جستوجو، بازیابی اطلاعات در وب، زبان جستوجو، واژگان عمومی، موتور های کاوش

2-تعیین احساس از روی متن فارسی

چکیده: در بسیاری از کاربرد های تبدیل متن به گفتار بیهتر است تا مشخصات گفتار تولید شده هر چه بیشتر شبیه انسان باشد.برای این کار باید متنی که توسط سیستم ادا میشود. از لحاظ معنایی بررسی شود. یکی از مهمترین این ویژگی های معنایی احساس حاکم بر متن است. در زمینه تعیین احساس از روی متن کار های مختلفی در زبان انگلیسی صورت گرفته است. اما کمتر کسی اقدام به کار بر روی پیکره های فارسی کرده است. در این مقاله پیکره ای شامل 3702 جملخ از 6 کلاس احساس خوشحالیف عصبانیت، خنثی، ناراحتی، تنفر و ترس تهییه شده است. و روش های گوناگونی جهت تعیین احساس از روی یک جمله متنی به زبان فارسی به کار گرفته شده است. با بررسی نتایج بدست آمده متوجه میشویم که عملکرد برنامه در صورت استفاده از رویکرد مبتنی بر پیکره مطلوب است و دارای حداکثر دقت 78/85% و زمان بسیار کوتاه آموزش می باشد.

کلید واژه ها: پردازش زبان طبیعی، مدل زبانی، تحلیل معنایی، یادگیری ماشین، complement naive bayes

3-نگرشی جدید به تحلیل عبارت های اسمی هم مرجع

چکیده: پردازش زبان طبیعی شامل وظایفی همچون استخراج اطلاعات ، خلاصه سازی متن، پرشس و پاسخ می باشد که همگی نیاز دارند تا تمام اطلاعاتی که در مورد یک موجودیت در متن وجود دارد را شناسایی نماید. بنابراین وجود سیستمی که بتواند موضوع تحلیل عبارت های اسمی هم مرجع را بررسی نماید . کمک شایانی به انجام موفقیت آمیز این وظایف خواهد نمود. ما در این مقاله سعی داریم تا به طور دقیق فرایند تحلیل مرجع مشترک را بررسی نماییم. در همین راستا نیز فرآیند مشابه دیگری تحت عنوان تحلیل پیشایند را نیز مطالعه خواهیم نمود. امید داریم تا با بررسی این فرآیند و مقایسه ی شباهت ها و تفاوت ها ی آنها، به نگرشی جدید در مورد تحلیل عبارت های اسمی هم مرجع برسیم.

کلمات کلیدی: پردازش زبان طبیعی، استخراج اطلاعات، تحلیل مرجع مشترک، تحلیل پیشایند

4- ایجاد و انتشار زیر ساخت وب معنایی برای قرآن کریم

چکیده: زبان شناسی رایانه ای در سال های اخیر به یکی از دقدقه های اساسی محققان و پژوهشگران حوزه کامپیوتر و زبان شناسی تبدیل شده است. استفاده از رایانه و ابزار های هوشمند باعث شده است که بتوان بسیاری از کارهای مرتبط با پردازش متن را با سرعت بالا و دقت قابل توجهی انجام داد. پردازش زبان طبیعی در حوزه متن به پردازش پیکره های متنی در واقع نمادی از زبان هستند که با هدف خاصی تولید گردیده است می توان با تحلیل آنها به استخراج اجزا قواعد و ساز و کار زبان پی برد و در مرحله بعد با فناوری و غنی سازی متون و یا بکار گیری فناوری های رایانه ای محیط پژوهشی مناسبی را در ارائه محتوای این متون به گونه ای کارآمد ایجاد نمود.

کلید وازه ها: پردازش زبان طبیعی، پیکره، وب معنایی، قرآن کریم، RDF

5-بررسی روشهای متن کاوی درحوزه یادگیری الکترونیکی به منظور ارائه مدلی جهت استخراج اطلاعات

چکیده:متن کاوي آشکار کردن اطلاعات پنهان با استفاده از روشی است که در یک طرف توانايی مقابله با تعداد زيادي کلمات و ساختارهايی در زبان طبیعی را نشان می دهد و از طرف ديگر اجازه مديرت ابهام و شک را میدهد. متن کاوي حوزهي مهم در پژوهش است که کشف طلاعات ناشناخته را،بهوسیله استخراج خودکار طلاعات از منابع مختلف متنی ممکن میسازد. مقدار بسیارزياد اطلاعاتی که درمتونبهصورت ساختن يافته ذخیره شدهاست، براي امکان پردازش به وسیله متن کاوي، به صورت دنباله هاي سادهي رشتهاي تبديل میشوند.بنابراين،روشهاوالگوريتم هاي به خصوصی براي پردازش واستخراج الگوهاي مفیدمورد نیاز است. علاوه بر اين، متن کاوي عموماً به استخراج اطلاعات و دانش مورد نظر از متون ساخت نايافته میپردازد. روش تحقیق در اينکار بدين صورت است که ابتدا به بررسی پژوهش هاي انجام شده در حوزه متن کاوي با تأکید بر روش ها و کاربردهاي آن در آموزش الکترونیکی پرداخته شد. درطی اين مطالعات، پژوهش هاي مرتبط در حوزه آموزش الکترونیکی طبقه بندي گرديدند. پس از طبقه بندي پژوهش ها، مسائل و راهکارهاي مرتبط با مسائل مطرح شده در آن کارها، استخراجشدند. در همین راستا، در اين مقاله ابتدا به تعريف متنکاوي پرداخته می شود . سپس فرايند متن کاوي و حوزه هاي کاربرد متن کاوي در آموزش الکترونیکی مورد بررسی قرار میگیرند. در ادامه روشهاي متنکاوي معرفی شده، و تک تک اين روشها در حوزه آموزش الکترونیکی مطرح میگردد. در انتها ضمن استنتاج نکات مهم مطالعات انجام شده، مدلی جهت استخراج اطلاعات براي بهره برداري از روش هاي متن کاوي در يادگیري الکترونیکی پیشنهاد میشود. 6-ارزیابی سیستماتیک متون دانشجویان در کلاس های مجازی آنلاینچکیده: عدم تعاملات و ارتباط مستقیم اساتید و دانشجویان منجر به عدم تمرکز ایشان در کلاس های مجازی می شود .از آنجا که ارزیابی همواره ابزار مناسبی برای ایجاد تمرکز و مشارکت دانشجویان بوده است منطقی است که به دنبال ابزاری جهت برآورد میزان مشارکت دانشجویان در کلاس های آنلاینباشیم. در این مقاله سعی داریم با استفاده از روش های متن کاوی ، پردازش زبان طبیعی و ترجمه ماشینی به الگوریتمی جهت ارزیابی متون وارد شده از سوی دانشجویان و تخصیص امتیاز به هر متن دست یابیم و بتوانیم پس از پایان کلاس با محاسبه، ثبت و اعلام برآورد امتیازات هر دانشجو به یک ارزیابی از میزان مشارکت مفید دانشجو درکلاس های آنلاین دست یابیم. 7-مروری بر روش های خلاصه سازی خودکار متون چکیده : امروزه پردازش زبان طبیعی در زمینه های گوناگون نظیرخلاصه سازهای خودکار ومترجم های ماشینی1،توجه زیادی را به خود جلب نموده اند .در زبان فارسی هم مانند سایرزبانهای دیگر دنیا تلاش هایی در زمینه ساخت ابزارهای خلاصه سازی صورت گرفته است .تمرکز محققان بر ارایه روشهایی متمرکز است که بتواند خلاصه هایی پر محتوا، سلیس و روان نسبت به روشهای خلاصه سازی پیشین ارایهدهند. خلاصه سازی یک مهارت نگارشی به شمار میرود، که هدف از ایجاد سیستم خلاصه سازاتوماتیک تقلید کلیه مراحل است.که توسط عامل انسانی انجام میشود، بدین صورت که متن به طور کامل خوانده و فهمیده شود و با تشخیص و تفکیک قسمتپ های مهم و غیرمهم متن، نسخه خلاصه شده متن اصلی تولید گردد .هدف از خلاصه سازی خودکار سند، تولید یک نسخه مختصرتر از سند اصلی توسطیکبرنامهرایانه ای به نحوی که ویژگی ها و نکات اصلی سند اولیه حفظ شود . بنابر تعریف ارائه شده در استاندارد 212 ISO خلاصه " یک بازگویی مختصر از سند " می باشد . روش های تولید خلاصه را با توجه به انواع دیدگاه های مختلف خلاصه سازی می توان به چندین دسته تقسیم بندی نمود، به عنوان مثال روش تولید خلاصه تک سندی و چند سندی، تک زبانه و چند زبانه، مبتنی بر تعامل با کاربر و غیر مبتنی برتعامل با کاربر...یکن با توجه به اهمیت فاکتور خروجی تولید خلاصه در این مقاله به بررسی روش های تولید خلاصه گزینشی ( استخراجی )و چکیده ای (مفهومی) پرداخته می شود. 8-بررسی انواع منابع دارای ساختار و منابع بدون ساختار و پیش پردازش های ابهام زدایی مفهوم کلمات در پردازش زبان طبیعی چکیده: دانش مهمترین بخش ابهام زدایی مفهوم کلمات است. این دانش ها می توانند در شکل های گوناگون و به صورت یک مجموعهاز متون باشند که در آن مفهوم کلمه برچسب گزاری شده است. پایگاه دانش یک مجموعه از متن، برچسب ها و توضیحات در جهت تشخیص مفهوم کلمه است. مانند فرهنگ لغت قابل خواندن توسط ماشین ، شبکه معنایی، اصطلاحنامه و آنتولوژی. تقریبا از تمام این منابع در ابهام زدایی مفهوم کلمات استفاده می شود. کلیه منابع به دو دسته منابع دارای ساختار و منابع بدون ساختار تقسیم می شوند. جمله ورودی، یک متن بدون ساختار از اطلاعات است. برای کسب مفهوم صحیح کلمات باید بر روی آن پیش پردازش های ی انجام شود تا بتوانیم بستری را فراهم نماییم که بتوان بهترین مفهوم را بدست آورد. در این مقاله،منابع دارای ساختار و منابع بدون ساختار و پیش پردازش های ابهام زدایی مفهوم کلمات در پردازش زبان ط بیعی را مورد بررسی قرار می دهیم که بر اساس بررسی های انجام شده، استفاده از وردنت پیشنهاد می شود که یک منبع ضروری برای ابهام زدایی مفهوم کلمات است و یک منبع دارای ساختار می باشد. کلمات کلیدی:اصطلاحنامه، فرهنگ لغت های قابل خواندن توسط ماشین، آنتولوژی، وردنت، Corpora 9-مروری برجدیدترین تکنیک های جست وجوی معنایی در قرآنچکیده: در دنیای اطلاعاتی امروز جست و جوی معنایی در قرآن، به عنوان یکی از غنی ترین پیکره های متنی از اهمیت ویژه ای برخودار است. این کتاب مقدس، راهنمای مسلمانان در حوزه های مختلف دانش مانند: طبیعت ، شریعت ، تاریخ می باشد. با توجه به سبک منحصر به فرد قرآن و پراکندگی موضوعات و به سبب آن پراکندگی مفاهیم، نیاز مند توجهی خاص جهت جست و جو ی مفاهیم و معانی در آیات آن است. امروزه مطالعات بسیاری در زمینه ی ایجاد ساختاری مناسب جهت بازیابی آیات قرآن و تسهیل کاربران در جست و جو ی معنایی در آن انجام شده است . از جمله تکنیک های جست و جو ی معنایی که در حوزه ی قرآن استفاده شده است، آنتولوژی، شبکه ی واژگان و متدهای بازیابی اطلاعات بین زبانی می باشند . هدف این مقاله بررسی تحقیقات انجام شده در این حوزه است . در این راستا ابتدا تکنیک های نامبرده شرح داده می شو ن د سپس پژوهش هایی که این متدها را ه کار بسته اند معرفی می گرد ن د و در نهایت مقایسه ای بین کارهای انجام شده ارائه خواهد شد. کلمات کلیدی: آنتولوژی، جست وجوی معنایی، گروه مترادف ها، بازیابی اطلاعات بین زبانی

برای خرید و دانلود اینجا کلیک کنید